第五部分
运动
总论
Kandel-Ch30_0707-0736.indd 707 18/01/21 6:00 PM
29.5.1: 公元前 4-5 世纪,在意大利鲁沃迪普利亚科索 · 科图加诺墓地中,舞者墓中的佩塞特妇女舞蹈壁画
该墓为半室设计,它的 6 块彩绘面板描绘了 30 名跳舞的女性,她们从左到右移动,双臂交叉,仿佛她们在坟墓
内部绕着圆圈跳舞。墓中死者的遗骸显然属于一位杰出的男性战士。陵墓以墓中壁画上出现的舞女命名。带有
壁画的展板现陈列在那不勒斯国家考古博物馆。
正如许多词典提醒我们的那样,运动能力是动物生命的一个决定性特征。正如运动系统研究的先驱林顿
所指出的那样:“人类所能做的就是移动物体,因为无论是在轻声发出一个音节,还是砍伐一片森林,唯一的执
行者都是肌肉。
人类能够进行的大量运动源于大约 640 块骨骼肌的活动,这些骨骼肌都在中枢神经系统的控制下。大脑和
脊髓的运动中心在处理了有关身体及其周围环境的感觉信息后,会发出神经命令,从而实现协调的、有目的的
移动。
运动系统的任务与感觉系统的任务相反。感觉处理在大脑中产生外部世界或身体状态的内部表示。运动处
理从内部表示(运动的预期目的)开始。然而,至关重要的是,这种内部表示需要通过内部生成的信息(有效副
本)和外部感觉信息不断更新,以在运动展开时保持准确性。
正如感官处理的心理物理学分析告诉我们感官系统的能力和局限性一样,运动表现的心理物理学分析揭示
了运动系统使用的控制规则。
因为日常生活中的许多运动行为都是无意识的,所以我们通常不知道它们的复杂性。例如,简单地直立需
要不断调整许多姿势肌肉,以响应微小摇摆引起的前庭信号。步行、跑步和其他形式的运动涉及中枢模式发生
器、门控感觉信息和下行命令的联合作用,它们共同产生对适当肌肉组的交替兴奋和抑制的复杂模式。许多动
(例如发网球或在钢琴上弹奏琶音)发生得太快,而无法通过感官反馈进行调整。相反,小脑等中心利用预测
模型来模拟传出命令的后果,并允许非常短的延迟校正。运动学习为神经可塑性研究提供了最富有成果的学科
之一。
运动系统以功能层次结构组织,每个层次涉及不同的决策。最高和最抽象的层面,可能需要前额叶皮层,
及运动或一系列运动动作的目的。下一个层次与运动规划的形成有关,涉及大脑皮层后顶叶和运动区间的
相互作用。前运动皮层根据来自后顶叶皮层的关于环境和身体在空间中位置的感觉信息来指定运动的时空特征。
层次结构的最低层协调执行规划运动所需肌肉收缩的时空细节。这种协调是由初级运动皮层、脑干和脊髓执行
的。这种串行视图具有启发性价值,但有证据表明,许多这些过程可以并行发生。
现在已经在特定递质系统的生物化学水平上描述了运动系统的某些功能及其受疾病的干扰。事实上,发现
帕金森病患者基底神经节中的神经元缺乏多巴胺,是第一个重要线索,表明中枢神经系统的神经系统疾病可能
由化学传递改变引起。神经生理学研究提供了有关此类递质如何在动作选择和增强成功动作中发挥关键作用的
信息。
628
总论
了解运动系统的功能特性不仅本身很重要,而且有助于我们了解该系统的疾病并探索治疗和恢复的可能性。
正如对如此复杂的组织所预期的那样,运动系统会出现各种故障。运动系统不同程度的紊乱会产生不同的症状,
包括基底神经节疾病(如帕金森病)的运动迟缓特征、小脑疾病出现的共济失调、以及脊髓损伤典型的痉挛和
无力。因此,患者的神经系统检查不可避免地包括反射、步态和灵活性的测试,所有这些都提供了有关神经系统
状态的信息。除了药物治疗外,运动系统疾病的治疗还通过 2 种新方法得到了加强。首先,基底神经节的局灶性
刺激已被证明可以恢复某些帕金森病患者的运动能力;这种大脑深部刺激也正在其他神经疾病和精神疾病的背
景下进行测试。其次,运动系统已成为神经假体的应用目标;神经信号被解码并用于驱动设备,以帮助脊髓损伤
和中风引起的瘫痪患者。
629
30 感觉运动控制原理
本书前面的章节探讨了大脑如何构建我们周围世界的内部表示。当用于指导运动时,这些表示在行为上是
有意义的。因此,感觉表征的一个重要功能是塑造运动系统的动作。本章使用从大脑和肌肉骨骼系统的行为研
究和计算模型中得出的概念描述了支配运动神经控制的原则。
我们首先考虑运动系统在产生熟练动作时面临的挑战。然后,我们研究了一些已经进化来应对这些挑战并
产生平稳、准确和高效运动的神经机制。最后,我们将看到运动学习如何提高我们的表现并使我们能够适应新
的机械条件,例如使用工具时,或学习感觉和运动事件之间的新对应关系,例如使用计算机鼠标控制光标时。
章重点介绍自主运动;第 32 章和第 33 章将更详细地讨论反射和节奏运动。
自主运动是由跨越不同层次的感觉和运动层次结构的神经回路产生的,包括大脑皮层区域、皮层下区域(如
基底神经节和小脑)以及脑干和脊髓网络。这些不同的结构具有独特的神经活动模式。此外,对不同结构的局
灶性损伤会导致明显的运动缺陷。尽管人们很容易认为这些单独的结构具有不同的功能,但这些大脑和脊柱区
域通常作为一个网络一起工作,因此对一个组件的损坏可能会影响所有其他组件的功能。本章讨论的许多原则
不能轻易归因于单个大脑或脊柱区域。相反,分布式神经处理可能是支持感觉运动控制的计算机制的基础。
30.1 运动控制对神经系统提出挑战
运动系统产生作用于肌肉的神经指令,使它们收缩并产生运动。从系鞋带到接发球,我们移动的轻而易举
掩盖了所涉及的控制过程的复杂性。感觉运动控制中固有的许多因素是造成这种复杂性的原因,当我们试图制
造机器来执行类似人类的运动时,这一点就变得非常明显(第 39 章)。尽管计算机现在可以在国际象棋和围
方面击败世界上最好的棋手,但没有机器人可以像 6 岁孩子那样灵活地操纵棋子。
如图 30.1.1 所示,接发网球的动作说明了为什么运动控制对大脑具有挑战性。首先,运动系统必须应对不
同形式的不确定性,例如我们对世界状况和我们可能获得回报的不完全了解。在感官方面,虽然球员可以看到
发球,但她无法确定对手将瞄准哪里或球可能击中球拍的位置。在运动方面,不同可能的回球方式是否成功也
存在不确定性。熟练的表现需要通过预测我们可能遇到的事件(对手的网球发球轨迹)和运动规划(采取适当
的姿势来接回预期的发球)来减少不确定性。
其次,即使球员能够可靠地估计球的轨迹,她也必须根据感官信号确定她将使用 600 块肌肉中的哪块肌
来移动她的身体和球拍来拦截球。控制这样的系统可能具有挑战性,因为很难在具有许多自由度(例如,大量
个体肌肉)的系统中有效地探索所有可能的动作,这使得学习变得困难。我们将看到运动系统如何通过控制肌
肉群(称为协同作用)来降低肌肉骨骼系统的自由度以简化控制。
第三,不需要的干扰(称为噪声)会破坏许多信号,并且存在于感觉运动控制的所有阶段,从感觉处理到规
划,再到运动系统的输出。例如,在网球发球中,即使发球者试图击中球场上的同一位置,这种噪音也会导致球
落在不同的位置。反映球位置的感官反馈和运动输出都被噪音污染了。这种噪音中固有的可变性限制了我们准
确感知和准确行动的能力。我们的运动命令中的噪音量往往会随着命令越强(即更大的力)而增加。这限制了
我们同时快速移动和准确移动的能力,从而需要在速度和准确性之间进行权衡。我们将看到有效的运动规划如
何最大限度地减少噪音对任务成功的不利影响。
第四,时间延迟存在于感觉运动系统的所有阶段,包括受体动力学引起的延迟、沿神经纤维和突触的传导
延迟,以及响应运动指令的肌肉收缩延迟。总之,这些延迟可能在 100 毫秒的数量级,取决于特定感觉模态
(例如,视觉比本体感觉更长)和处理的复杂性(例如,面部识别比运动感知更长)因此,我们实际上生活在过
去,控制系统只能访问关于世界和我们自己身体的过时信息。在尝试快速移动时,此类延迟可能会导致不稳定,
因为我们会尝试纠正我们察觉到但已不存在的误差。我们将看到大脑如何预测身体和环境的未来状态,以减少
此类延迟的负面影响。
第五,身体和环境在短期和长期的时间尺度上都会发生变化。例如,在相对较短的比赛时间内,运动员必须
纠正因疲劳而减弱的肌肉以及下雨时球场表面的变化。在更长的时间尺度上,随着我们的四肢变长和体重增加,
30.2 可以自主地、有节奏地或反射性地控制动作
714 Part V / Movement
Figure 30–1 The challenges of sensorimotor control.
others. Many of the principles discussed in this chapter
cannot be easily attributed to a single brain or spinal
area. Instead, distributed neural processing is likely to
underlie the computational mechanisms that subserve
sensorimotor control.
The Control of Movement Poses Challenges for
the Nervous System
Motor systems produce neural commands that act on
the muscles, causing them to contract and generate
movement. The ease with which we move, from tying
our shoelaces to returning a tennis serve, masks the
complexity of the control processes involved. Many
factors inherent in sensorimotor control are responsi-
ble for this complexity, which becomes clearly evident
when we try to build machines to perform human-like
movement (Chapter 39). Although computers can now
beat the world’s best players at chess and Go, no robot
can manipulate a chess piece with the dexterity of a
6-year-old child.
The act of returning a tennis serve illustrates why
the control of movement is challenging for the brain
(Figure 30–1). First, motor systems have to contend
with different forms of uncertainty, such as our incom-
plete knowledge with regard to the state of the world
and the rewards we might gain. On the sensory side,
although the player may see the serve, she cannot be
certain where her opponent will aim or where the ball
might strike the racket. On the motor side, there is
时变属性
比如使用工具、
肌肉疲劳
不确定性
比如球将在哪里
碰到球拍
复杂的动力学
比如,举起手臂会导致
姿势不稳定
噪声
感觉 运动
时间延迟
感觉和运动
感知到
实际
位置
多自由度
大约200
关节和600
块肌肉需
要控制
uncertainty as to the likely success of different possible
returns. Skilled performance requires reducing uncer-
tainty by anticipating events we may encounter (the
trajectory of an opponent’s tennis serve) and by motor
planning (adopting an appropriate stance to return the
expected serve).
Second, even if the player can reliably estimate the
ball’s trajectory, she must determine from sensory sig-
nals which of the 600 muscles she will use in order to
move her body and racket to intercept the ball. Con-
trolling such a system can be challenging as it is hard to
explore all possible actions effectively in a system with
many degrees of freedom (eg, a large number of indi-
vidual muscles), making learning difficult. We will see
how the motor system reduces the degrees of freedom
of the musculoskeletal system by controlling groups of
muscles, termed synergies, to simplify control.
Third, unwanted disturbances, termed noise, cor-
rupt many signals and are present at all stages of sen-
sorimotor control, from sensory processing, through
planning, to the outputs of the motor system. For
example, in a tennis serve, such noise will cause the
ball to land in different places even when the server is
trying to hit the same location on the court. Both sen-
sory feedback, reflecting the ball’s location, and motor
outputs are contaminated with noise. The variability
inherent in such noise limits our ability to perceive
accurately and act precisely. The amount of noise in
our motor commands tends to increase with stronger
commands (ie, more force). This limits our ability to
move rapidly and accurately at the same time and thus
Kandel-Ch30_0707-0736.indd 714 18/01/21 6:00 PM
30.1.1: 感觉运动控制的挑战。
我们的运动系统的特性在生长过程中会发生巨大变化。正如我们将看到的,运动系统不断变化的特性使我们必
须高度重视利用运动学习来适当调整控制的能力。
最后,运动指令与后续动作之间的关系非常复杂。每个身体部分的运动通过机械相互作用在所有其他身体
部分产生扭矩,并可能产生运动。例如,当一名球员举起球拍击球时,她必须预判会导致失衡的力,并采取措施
抵消这些力以保持平衡。事实上,当我们站立时向前举起手臂时,首先激活的肌肉是踝屈肌,以确保我们保持直
立。我们将看到感觉运动系统如何控制不同部分的运动以保持动作的精细协调。
30.2 可以自主地、有节奏地或反射性地控制动作
虽然运动通常根据功能分类,如眼球运动、抓握(伸手和抓握)、姿势、运动、呼吸和说话,但其中许多功
能是由重叠的肌肉群提供的。此外,相同的肌肉群可以有意识地、有节奏地或反射性地受到控制。例如,控制呼
吸的肌肉可以用来在潜入水下之前自主地深呼吸,以有规律的吸气和呼气循环自动和有节奏地呼吸,或者对喉
咙中的有害刺激做出反射性反应,产生咳嗽。
自主运动是那些在意识控制下的运动。有节奏的运动也可以自主控制,但与自主运动的不同之处在于,它
们的时间和空间组织在更大程度上由脊髓或脑干回路自主控制。反射是由脊髓或脑干中的神经回路产生对特定
刺激的模式化反应(尽管有些反射涉及通过皮层的通路)。这些反应比自主反应发生的时间更短。
尽管我们可能打算有意识地执行一项任务或规划一系列动作,并且有时会意识到自己决定在特定时刻移动,
但动作通常似乎是自动发生的。对运动的瞬间控制不需要有意识的过程。我们执行最复杂的动作,而没有考虑
所需的实际关节运动或肌肉收缩。网球运动员不会有意识地决定使用哪些肌肉来反手接发球,或者必须移动哪
些身体部位来拦截球。事实上,在每个身体动作发生之前考虑它会扰乱玩家的表现。
30.3 运动命令通过感觉运动过程的层次结构产生
尽管肌肉骨骼系统的最终输出是通过脊髓中的运动神经元进行的,但肌肉对特定动作的运动控制是通过控
制中心的层次结构进行的。这种安排可以简化控制:高层可以规划更多的全局目标,而低层则关心这些目标如
何实现。
631
30.4 运动神经信号受前馈和反馈控制
在最低层次上,肌肉本身具有的特性可以在没有任何运动命令变化的情况下对控制产生影响。与机器人的
达不同,性,作用和长
(第 31 章)。作为一种简单的近似,肌肉可以被看作像弹簧(拉伸时增加张力,缩短时减小张力)和阻尼器(随
着拉伸率的增加而增加张力)在小范围扰动下,这些特性通常会起到稳定肌肉长度的作用,从而稳定肌肉作用
的关节。例如,如果外部扰动使关节伸展,屈肌会被拉伸,增加张力,而伸肌会缩短,张力会降低,张力的不平
衡会使关节回到原来的位置。这样的控制方式有一个显著的优势,与运动层级中较高层次的控制不同,这种力
的变化是肌肉被动物理特性的直接结果,因此几乎没有延迟。
除了肌肉的被动特性外,感觉输入可以直接引起运动输出,而无需高层脑中枢的干预。感觉运动反应,如脊
髓反射,控制局部干扰或伤害性刺激。反射是由脊髓或脑干中的简单神经回路产生的对特定刺激的模式化响应。
例如,脊柱屈肌缩回反射可以在没有来自大脑的任何下行输入的情况下将您的手从热炉中移开。这种反应的优
点是速度快;缺点是它们不如自主控制系统灵活(第 32 章)同样,存在反射回路的层次结构。最快的是单突触
牵张反射,它驱动被拉伸的肌肉收缩。在这个反射回路中,由肌肉中的拉伸感受器(肌梭)激活的感觉神经元直
接与使同一块肌肉收缩的运动神经元形成突触连接。从刺激到响应的时间约为 25 毫秒。这种反射可以通过敲打
髌骨正下方的股四头肌肌腱进行临床测试。
虽然这种单突触牵张反射不适用于短时间尺度,但涉及更高层结构(如运动皮层)的多突触反射可以在 70
毫秒左右产生响应。与单突触反射不同,多突触反射可适应行为目标的变化,因为连接感觉神经元和运动神经
元的回路可以通过任务相关特性进行修改。反射的强度往往会随着肌肉中的张力而增加(称为增益缩放)因此,
可以通过共同收缩关节周围的一组肌肉来放大反射,从而以更大的力响应扰动。事实上,我们在过马路时牵着
一个叛逆的孩子的手时就使用了这种共同收缩。这种策略可以放大反应,从而减少随机外力引起的手臂偏差。
最后,自主运动是那些受大脑有意识控制的运动。自主运动可以在没有刺激的情况下产生或用于补偿扰动。
响应物理扰动而产生自主运动的时间取决于扰动的性质(模态和大小)以及是否可以在扰动发生之前指定响应。
例如,对小物理扰动的自主校正可能会延迟约 110 毫秒。
尽管我们描述了从反射到自主控制的运动层级中不同水平的明确区别,但实际上,这种区别在覆盖不同潜
伏期的连续反应中是模糊的。增加反应时间允许额外的神经回路参与到感觉运动环路中,并倾向于增加反应的
复杂性和适应性,从而在运动层级中形成反应速度与处理复杂性之间的权衡。
30.4 运动神经信号受前馈和反馈控制
在本节中,我们将首先说明一些对处理感觉延迟、感觉噪声和运动噪声问题很重要的控制原理。为简单起
见,我们将讨论限制在相对简单的动作上,例如响应头部运动移动眼睛或将手从一个位置移动到另一个位置。
们考虑两大类控制,前馈和反馈,它们在运动过程中对感官反馈的依赖程度不同。
30.4.1 快速运动需要前馈控制
有些动作是在没有监测动作产生的感官反馈的情况下执行的。在这种前馈控制情况下,运动命令的生成不
考虑感官后果。因此,如图 30.4.1A 所示,此类命令也称为开环,反映了感觉运动环路不是由感觉反馈完成的事
实。
开环控制需要一些关于身体的信息,以便生成适当的命令。例如,它应该包括有关运动系统动力学的信息。
这里的“动力学”是指施加的运动命令(或扭矩或力)与随后的身体运动(例如关节旋转)之间的关系。对于
完美的开环控制,需要反转动力学以计算将产生所需运动的运动命令。执行这种反转的神经机制称为逆向模型,
是一种内部模型(文本框 30.1耦合到开环控制的反向模型可以确定需要哪些运动命令来产生实现目标所需的
特定运动。
632
30.4 运动神经信号受前馈和反馈控制
A 前馈控制
B
反馈控制
期望的状态
前馈控制器
执行机构
(肌肉)
感知的状态
运动指令
误差
比较器
前馈控制器
输入加工
(滤波、放大)
传感器
(肌梭)
执行机构
(肌肉)
+
运动指令
期望的
状态
期望的
状态
30.4.1: 前馈和反馈控制。A. 前馈控制运动命令基于所需状态。不会监控移动过程中出现的误差。虽然我们说
明了手臂前馈控制的元素,但只有任何手臂运动的初始部分是由前馈信号驱动的,并且运动通常涉及反馈控制。
B. 通过反馈控制,比较所需状态和感测状态(在比较器处)以生成误差信号,这有助于形成运动命令。感觉信
息反馈给比较器可能会有相当大的延迟。
633
30.4 运动神经信号受前馈和反馈控制
文本框 30.1 (内部模型)
数值模型在物理科学中的应用有着悠久的历史。数值模型是复杂物理系统的抽象定量表示。有些
表示初始条件的方程和参数开始,在时间或空间上向前运行,以在未来的某个状态下生成物理变量。
如,我们可以构建一个天气模型,预测两周后的风速和温度。
其他模型从一个状态开始,一组具有特定值的物理变量,并以相反的方向运行,以确定系统中的哪些
参数解释了该状态。当我们将一条直线拟合到一组数据点时,我们正在构建一个反向模型,该模型基于线
性系统的方程来估计斜率和截距。因此,反向模型可以允许我们知道如何设置系统的参数以获得期望
结果。
在过去的 50 年里,神经系统有类似的物理世界预测模型来指导行为的想法已经成为神经科学的一个
主要问题。这种模型被称为“内部”,因为它是在神经回路中实例化的,因此是中枢神经系统的内部。这
个想法起源于肯尼思 · 克雷克关于认知功能内部模型的概念。在他 1943 年出版的《解释的本质》一书中,
克雷克可能是第一个提出生物体利用外部世界的内部表示的人:
如果生物体的头脑中有一个外部现实和自身可能行动的“小规模模型”它就能够尝试各种替代方案,
得出哪种方案最好,在未来情况出现之前对其做出反应,利用过去事件的知识来应对现在和未来,并以各
种方式做出更全面、更安全、以及以更有效的方式应对面临的紧急情况。
在这种观点中,内部模型允许生物体在考虑潜在动作的后果,但无需实际投入这些行为。在感觉运动
控制的背景下,内部模型可以回答 2 个基本问题。首先,我们如何生成作用于肌肉的运动命令,从而控制
我们身体的行为?第二,我们如何预测我们自己的运动指令的后果?
中枢神经系统必须同时进行控制和预测,才能获得熟练的运动表现。如图 30.4.3 所示,预测和控制是
一枚硬币的两面, 2 个过程精确地映射到前向模型和反向模型上。预测将运动指令转化为预期的感觉
结果,而控制将期望的感觉结果转化为运动指令。
尽管不监控行动的后果似乎适得其反,但有充分的理由不这样做。如前所述,主要原因是感知和动作都有
延迟。也就是说,感觉受体将刺激转化为神经信号并将这些信号传送到中枢神经元需要时间。例如,视觉输入可
能需要大约 60 毫秒才能在视网膜中处理并传输到视觉皮层。除了传入感觉系统的延迟外,中央处理、传出信号
向运动神经元的传输以及肌肉的反应也存在延迟。总之,组合的感觉运动回路延迟是可观的,对于视觉刺激的
运动反应大约为 120 150 毫秒。这种延迟意味着像眼跳这样在 30 毫秒内重定向凝视的运动不能使用感官反馈
来引导运动。即使对于较慢运动,比如要时 500 毫秒的伸手,也不能使用感官信息指导运动的初始部分,因此必
须使用开环控制。
开环控制也有缺点。任何因规划或执行不准确而导致的运动误差都不会得到纠正,因此会随着时间或连续
运动而复合。受控系统越复杂,通过学习得到准确的反向模型就越困难。
纯开环控制系统的一个例子是响应头部旋转的眼睛控制。前庭-眼动反射(第 27 章)使用开环控制在头部旋
转期间将视线固定在物体上。前庭迷路感知头部旋转并通过三突触回路驱动眼睛的适当运动。反射在运动过程
中不需要(或使用)视觉(在黑暗中转动头部时眼睛保持稳定的注视)。来自前庭系统的感觉信息确实会驱动眼
球运动,但控制是前馈的(在运动过程中不会纠正出现的任何误差)这种精确的开环控制是可能的,因为眼睛
的动态特性相对简单,前庭迷路可以直接感知头部的旋转,并且眼睛往往不会受到外部事件的显著干扰。相比
之下,为复杂的肌肉骨骼系统(例如手臂)优化反向模型非常困难,因此,手臂运动的控制需要某种形式的误差
校正。
30.4.2 反馈控制使用感官信号来纠正动作
为了纠正出现的运动误差,必须监测运动。如图 30.4.1B 所示,执行纠错的系统被称为反馈控制闭环控制
因为感觉运动回路是完整的。
最简单的反馈控制形式是当误差超过某个阈值时控制系统产生固定响应。在大多数中央供暖系统中都可以
看到这样的系统,其中恒温器被设置为所需的温度。当房屋温度低于指定水平时,加热会打开,直到温度达到
634
30.4 运动神经信号受前馈和反馈控制
该水平。虽然这样的系统简单且有效,但它的缺点是输入房屋的热量与实际温度和所需温度之间的差异(误差)
无关。更好的系统是控制信号与误差成正比的系统。
这种运动的比例控制包括感知手的实际位置和期望位置之间的误差。校正运动命令的大小与误差的大小成
比例,并且在减小误差的方向上。每单位位置误差增加或减少校正运动命令的量称为增益。通过不断纠正运动,
反馈控制对感觉运动系统中的噪声和环境扰动都具有鲁棒性。
虽然反馈控制可以更新命令以响应运动期间出现的偏差,但它对反馈延迟很敏感。如图 30.4.2 所示,在没
有任何延迟的情况下,随着反馈控制器增益的增加,系统将以更高的保真度跟踪理想的位置。然而,随着反馈
延迟的增加,控制系统可能开始振荡并最终变得不稳定。这是因为随着延迟,系统可能会响应不再存在的误差,
甚至可能在误差的方向上进行纠正。
720 Part V / Movement
Figure 30–4 The interplay of gain and delay in feedback
control.Performance of a feedback controller trying to track a
target moving sinusoidally in one dimension. The sensory feed-
back signal that conveys error in the position arrives after some
period of time (the delay), and the motor system tries to correct
for the error by increasing or decreasing the size of its com-
mand relative to the error (the gain).
The plots show the performance in which there is either
instantaneous feedback (no delay) of error (left column) or
feedback with delay of 80 or 100 ms (middle and right col-
umns). When the gain is high and the delay is low, tracking is
very good. However, when the delay increases, because the
controller is compensating for errors that existed 80 or
100 ms earlier, the correction may be inappropriate for the cur-
rent error. The gain can be lowered to maintain stability, but
as the feedback controller corrects errors only slowly, tracking
becomes inaccurate.
At low gain (bottom row), the feedback controller corrects
errors only slowly and tracking is inaccurate. As the gain
increases (middle row), the feedback controller corrects
errors more rapidly and tracking performance improves. At
high gain (top row), the system corrects rapidly but is prone
to overcorrect, leading to instability when the time delay in
feedback is on the order of physiological time delays (top
right). Because the controller is compensating for errors
that existed 100 ms earlier, the correction may therefore be
inappropriate for the current error. This overcorrection leads
to oscillations and is one mechanism proposed to account
for some forms of oscillatory tremor seen in neurological
disease.
0 0.5 1 1. 5 2
–4
–2
0
2
–4
–2
0
2
–4
–2
0
2
4
0 0.5 1 1. 5 200.5 1 1. 5 2
增益
增益
延迟 = 0 毫秒
时间(秒)
位置
延迟 = 80 毫秒
延迟增加
增加
增益
延迟 = 100 毫秒
目标
proprioceptive information from muscle spindles,
the stretch of the skin, and the sight of the arm. These
modalities have different amounts of variability (or
noise) associated with them, and just as we average a
set of experimental data to reduce measurement error,
these sensory modalities can be combined to reduce
the overall uncertainty in the state estimate.
The optimal way to combine these sources is for
higher brain centers to take the uncertainty of each
modality into account and rely on the more certain
modalities. For example, the location of the hand can
be sensed both by proprioception and vision. The sight
of your hand in front of you tends to be more reliable
than proprioception for estimating location along the
azimuth (right–left) but less reliable for depth (forward
back). Therefore, visual input should be given greater
weight than proprioceptive input when estimating
the azimuth location of your hand, and vice versa for
depth. By measuring the precision of each modality
when used alone, it is possible to predict the increased
Kandel-Ch30_0707-0736.indd 720 18/01/21 6:00 PM
30.4.2: 反馈控制中增益和延迟的相互作用。反馈控制器尝试跟踪一维正弦运动目标的性能。传达位置误差的
传感反馈信号在一段时间(延迟)后到达,运动系统尝试通过增加或减小相对于误差的命令大小(增益)来纠正
误差。该图显示了误差瞬时反馈(无延迟)(左列)或延迟 80 毫秒(中列)或 100 毫秒(右列)的性能。当增
益高且延迟低时,跟踪效果非常好。但是,当延迟增加时,由于控制器正在补偿 80 毫秒或 100 毫秒之前存在的
误差,因此校正可能不适用于当前误差。可以降低增益以保持稳定性,但由于反馈控制器只能缓慢地纠正误差,
因此跟踪变得不准确。在低增益(最后一行)时,反馈控制器只能缓慢地纠正误差,并且跟踪不准确。随着增益
增加(中间行),反馈控制器纠正误差的速度更快,跟踪性能也得到改善。在高增益(最上面一行)下,系统校
正速度很快,但容易过度矫正当反馈时间延迟达到生理时间延迟(右上)数量级时,会导致不稳定。由于控制
器正在补 100 秒前存在的误差,因此校正可能不适用于当前误差。这过度矫正会导致振荡,并且是一
解释神经系统疾病中出现某些形式的振荡性震颤机制。
用于跟踪移动物体平滑跟踪眼球运动是主要由反馈驱动运动的一个例子。平滑跟使用反馈来最小化视
网膜上的速度误差(凝视速度和目标速度之间的差异)我们可以比较前馈和反馈控制在最小化误差方面的效率。
比较一下“在快速来回转动头部时注视伸出的固定手指”与“在头部保持静止,快速左右正弦移动手指时尝试
635
30.4 运动神经信号受前馈和反馈控制
跟踪手指”的难易程度。虽然手指与头部的相对运动在 2 种情况下相同,但前者是精确的,因为它使用前庭-
动反射,而后者使用反馈(需要速度误差来驱动眼球运动),因此不太精确,特别是运动频率增加时。
在大多数运动系统中,运动控制是通过前馈过程和反馈过程的组合来实现。稍后我们将看到这 2 个组成
分自然地出现在一个统一的运动产生模型中。
30.4.3 对身体当前状态的估计依赖于感觉信号和运动信号
准确控制运动需要我们身体当前状态的信息,例如,身体不同部位的位置和速度。要抓住一个物体,我们不
仅需要知道物体的位置、形状和表面特性,还需要知道我们手臂和手指的当前布局,以便适当地改变手形和放
置手。
估计身体的状态不是一个小问题。首先,正如我们所见,感觉信号由于感觉转导和传导时间而延迟。因此,
来自我们的肌肉、关节和视觉的信号在到达中枢神经系统时都已经过时了。其次,我们接收到的感觉信号通常
是不精确的,并且会被神经噪声破坏。例如,如果您用一只手的手指触摸桌子的底部,并尝试用另一只手估计
它在桌子顶部的位置,您可能会偏离相当大的距离。第三,我们通常没有直接传递相关信息的传感器。例如,
然我们有报告肌肉长度和关节角度的传感器,但我们在肢体中没有直接确定手在空间中的位置的传感器。因此,
需要复杂的计算来尽可能准确地估计当前的身体状态。关于大脑如何估计状态,已经出现了几个原理。
首先,状态估计依赖于感受-运动转换的内部模型。鉴于我们肢体的固定长度,手臂的肌肉长度或关节角度
与手在空间中的位置之间存在数学关系。这种关系的神经表示允许中枢神经系统在知道关节角度和节段长度的
情况下估计手的位置。计算此类感受-运动转换的神经回路就是内部模型的示例(文本框 30.1
其次,可以通过组合多种感觉模态来改进状态估计。例如,关于我们四肢状态的信息来自肌梭、皮肤拉伸和
手臂视觉的本体感受信息。这些模态具有与之相关的不同量的可变性(或噪声)正如我们对一组实验数据进行
平均以减少测量误差一样,可以组合这些感官模态以减少状态估计中的总体不确定性。
结合这些来源的最佳方式是让更高层的大脑中心考虑到每种模态的不确定性,并依赖于更确定的模态。例
如,手的位置可以通过本体感觉和视觉来感知。在估计沿方位角(右-左)的位置时,手在你面前的视线往往比
本体感觉更可靠,但在深度方面(前-后)则不太可靠。因此,在估计手的方位角位置时,视觉输入应比本体感
受输入具有更大的权重,反之亦然。通过测量单独使用时每种模态的精度,可以预测同时使用 2 种模态时会提
高的精度。实验表明,这个过程通常接近最佳。还可以通过使用贝叶斯推理数学将先验知识与感官输入相结
合来提高精度(文本框 30.2
文本框 30.2 (贝叶斯推理)
贝叶斯推理是一种基于不确定信息对世界进行估计的数学框架。其基本思想是,在 0 1 之间概率
可以用来表示对不同选择的信任程度,例如你相信用公平骰子掷出 6 点的几率是 1/6
贝叶斯推理的美妙之处在于,通过使用概率规则,我们可以根据我们的经验和来自感官输入的新
息来指定信念应该如何形成和更新。例如,当打网球时,我们想估计球会落在哪里。由于视觉不能提供关
于球在飞行中的位置和速度的完美信息,因此着陆位置存在不确定性。然而,如果我们知道我们的感觉系
统中的噪声水平,那么可以使用当前的感觉输入来计算不同潜在着陆位置的特定感觉输入的可能性(即
概率)
我们可以从反复的比赛经验中学到更多的信息:球落地的位置在球场上的可能性不尽相同。例如,
弹位置可能集中在最难回球的边界线附近。这种分布被称为先验分布。
贝叶斯公式定义了如何结合先验和似然性来对反弹位置进行最佳估计。虽然贝叶斯方法最初是在
计学中发展起来的,但它现在提供了一个统一的框架来理解大脑如何处理感知、运动和认知领域的不
定性。
第三,运动指令也可以提供有价值的信息。如果身体的当前状态和下行运动命令都已知,则可以估计身体
的下一个状态。该估计可以从表示动作及其后果之间因果关系的内部模型中得出。这被称为向模型,因为它
根据运动输出估计未来的感觉输入(文本框 30.1。因此,前向模型可用于预测运动系统的状态将如何因运动指
636
30.4 运动神经信号受前馈和反馈控制
令而发生变化。下行运动命令的副本被传递到向模型中,该模型充当在环境中移动的肌肉骨骼系统的神经模
拟器。运动命令的这个副本称为传出副本(或伴随发送如果我们将两者串联起来,可以更好地理解前向模型
正向和反向模型。如图 30.4.3 所示,如果每个模型的结构和参数值都是正确的,前向模型的输出(预测的行为)
将与逆向模型的输入(期望的行为)相同。
期望的
行为
前向模型
预测的
行为
实际行为
传出副本
运动
命令
逆模型
30.4.3: 内部感觉运动模型代表身体与外部世界的关系。反向模型确定将产生行为目标的运动命令,例如在握
球时举起手臂。下行运动命令作用于肌肉骨骼系统以产生运动。运动命令的副本被传递到前向模型,该模型模
拟运动系统与世界的相互作用,从而可以预测行为。如果正向和反向模型都是准确的,则前向模型的输出(预
测行为)将与反向模型的输入(期望行为)相同。
使用运动命令来估计身体状态是有利的,因为与延迟的感觉信息不同,运动命令在作用于肌肉骨骼系统之
前可用,因此可用于预测状态的变化。然而,如果前向模型不完全准确,则此估计会随着时间的推移而漂移,
此,感官反馈用于纠正状态估计,尽管它有延迟。
运动命令用于状态估计似乎令人惊讶。事实上,前向模型的第一个演示使用了一个仅依靠运动命令来估计
状态的运动系统,即眼睛在眼眶内的位置。亥姆霍在试图理解我们如何定位视觉目标时首先考虑了运动预测
的概念。要计算物体相对于头部的位置,中枢神经系统必须知道物体在视网膜上的位置和眼睛的注视方向。
姆霍兹的巧妙建议是,大脑不是感知注视方向,而是根据对眼部肌肉的运动命令的副本来预测它。
亥姆霍兹在自己身上做了一个简单的实验来证明这一点。如果您在不使用眼部肌肉的情况下移动自己的眼
(遮住一只眼睛并用手指通过眼睑轻轻按压在睁开的眼睛上)视觉目标的视网膜位置就会发生变化。因为需
要眼部肌肉的运动命令来更新眼睛状态的估计,所以预测的眼睛位置不会更新。然而,由于视网膜图像发生了
变化,这导致了世界一定已经移动的误差感知。一个更具戏剧性的例子是,如果眼部肌肉因箭毒而暂时麻痹,
么试图移动眼睛会导致一种世界在移动的感觉。这是因为该命令导致眼睛移动的状态估计,但是在固定的视网
膜输入(由于麻痹)的情况下,唯一一致的解释是世界已经移动。
最后,最好的状态估计是通过将感觉方式与运动命令相结合来实现的。仅使用感觉反馈或仅使用运动预测
的缺点可以通过监视两者并使用前向模型估计当前状态来改善。执行此操作的神经装置被称为观察者模型。如
30.4.4 示,观察者模型的主要目标是补偿感觉运动延迟并减少由感觉和运动信号中的噪声引起的当前状态
估计的不确定性。这种模型得到了关于神经系统如何估计手部位置、姿势和头部方向的实证研究的支持。我们
将看到如何使用此类模型来解码脑机接口中的神经信号(第 39 章)
637
30.4 运动神经信号受前馈和反馈控制
动力学
模型
前向
感觉
模型
增益
预测的
感觉反馈
基于感觉
的校正
运动命令
传出副本
不确定性云
感觉
反馈
2 预测的当前状态 3 最终的状态估计
1 先前状态估计
+
+
+
30.4.4: 观察者模型。该模型用于估计手指在手臂运动期间的位置。使用运动命令的传出副本和动力学的前向
模型更新(2黄色云)可能的手指位置分布的先前估计(1蓝色云)。手指位置的更新分布大于先前估计的分
布。然后,该模型使用前向感觉模型预测这些新手指位置会发生的感觉反馈,并使用预测和实际感觉反馈之
间的误差来校正当前手指位置的估计。这种校正将感觉误差转变为状态误差,并且还确定了对效果复制和感觉
反馈的相对依赖。
当前手指位置(3紫色云)的最终估计具有较少的不确定性。随着该序列重复多次,该估计将成为后续移动的
新先前估计。为清楚起见,图中省略了必须补偿的感官反馈延迟。
638
30.4 运动神经信号受前馈和反馈控制
状态估计不是一个被动的过程。熟练的表现需要有效和高效地收集和处理与动作相关的感官信息。感官信
息的质量取决于我们的行为,因为我们看到、听到和触摸到的东西都会受到我们的动作的影响。例如,眼球运动
系统通过将中央凹定位到视觉场景中的兴趣点来控制眼睛的感觉输入。因此,运动可用于有效地收集信息,这
一过程称主动感知主动感知涉及 2 个主要过程:我们通过处理感官信息并对世界做出推断,以及通过
动作我们选择如何对世界进行采样以获得有用的感官信息。眼球运动可以揭示熟练表演者和业余表演者之间的
区别。例如,板球比赛中的击球手会预测性眼跳到他投出的球会落地的地方,等待它弹起,并在弹起后用平滑跟
踪眼动来跟踪球的轨迹。第一次眼跳的较短延迟将专业击球手和业余击球手区分开来。因此,运动系统也可用
于改善我们对世界的感知,从而收集信息,进而帮助我们实现运动目标。
30.4.4 预测可以补偿感觉运动延迟
正如我们所见,反馈延迟会导致运动过程中出现问题,因为延迟的信息不能反映身体和世界的当前状态。
预测 2 种策略可以补偿这种延迟,从而提高运动过程中信息的准确性。间歇是指运动因其他东西而暂时
中断,例如眼球眼跳和手动追踪。如果休息间隔大于感觉运动回路的时间延迟,间歇会促进更准确的感觉反馈。
预测是一种更好的策略,正如我们所见,它可以构成状态估计器的主要组成部分。
神经系统使用不同的控制模式,这些模式在不同程度上依赖于预测和感觉反馈。不同条件下目标操作的差
异很好地说明了这些模式。当物体的行为不可预测时,感官反馈为估计负载提供了最有用的信号。例如,在放风
筝时,我们需要几乎不断地调整抓握力以应对不可预知的风流。如图 30.4.5A 所示,在处理这种不可预测性时,
需要很大抓力以防止打滑,因为抓力的调整往往滞后于负载力的变化。
力(牛)
0
5
10
0 0.5 11.5 2 2.5 3 3.5 4
力(牛)
0
5
10
0 0.5 11.5 2 2.5 3 3.5 4
握力
负载力
手的动作
A 机器人控制运动
B 手控制动作
负载力
握力
滞后
握力负载力对齐
握力
负载力
机器人手臂移动
握力
30.4.5: 对自发动作的超前控
[249]
A. 当指示受试者握住以机械方式施加正弦负载力的物体时,手指的抓握
力很高以防止滑动,并且抓握力调节滞后于负载力的变化。其中以深红色实线突出显示的是负载力调节的一部
分,这会导致深红色虚线所示的相应抓握力滞后(试验时长为 4 秒)B. 当受试者通过下拉固定物体产生类似的
负载曲线时,可以预期负载力,因此,抓握力较低并且跟踪负载力没有延迟。
然而,当处理具有稳定属性的目标时,预测控制机制会很有效。例如,如图 30.4.5B 所示,当通过移动手臂
等自发动作增加负载时,抓握力会随着负载力瞬间增加。负载的感官检测速度太慢,无法解释抓握力的这种快
速增加。
这种预测控制对于灵巧行为中常见的快速运动至关重要。事实上,这种预测能力可以通过“服务员任务”
松证明。伸出一只手臂,将一本厚重的书放在手掌上。如果您随后用另一只手取书(就像服务员从托盘中取东
639
30.5 运动规划将任务转化为有目的的移动
西)支撑手保持静止。这表明我们有能力预测由我们自己的行为引起的负荷变化,从而在肌肉活动中产生适当
且精确的定时变化。相比之下,如果其他人从你手中拿走书,即使你在注视着拿走的过程,也几乎不可能让手保
持静止。我们将看到小脑病变如何影响这种预测能力,从而导致缺乏这种协调反应(第 37 章)
检测预测和实际感官反馈之间的任何差异在运动控制中也很重要。这种差异称为感官预测误差,可以驱动
内部模型的学习,也可以用于控制。例如,当我们拿起一个物体时,我们预计该物体何时会离开表面。大脑对意
外事件的发生或预期事件的未发生(即感觉预测误差)特别敏感。因此,如果物体比预期更轻或更重,因此过早
升起或无法升起,则会启动反应性响应。
除了用于补偿延迟之外,预测是感官处理中的一个关键要素。外部事件和我们自己的动作都会引起感官反
馈。在感觉受体中, 2 个来源是不可区分的,因为感觉信号不带有“外部刺激”“内部刺激”的标签。通过
减少我们自己运动的反馈,可以增强对外部事件的敏感性。因此,从总感觉反馈中减去由我们自身运动产生感
觉信号的预测,可以增强携带外部事件信息的信号。这种机制导致了这样一个事实,即自己挠痒痒的体验不如
别人挠痒痒那么强烈。当要求受试者使用机器人接口挠自己痒时,但在运动命令和由此产生的触觉输入之间引
入了时间延迟时,挠痒感会增加。通过这种延迟的触觉输入,预测变得不准确,因此无法取消感官反馈,导致痒
感增加。这种通过运动动作对感觉信号进行的预测调节是许多感觉系统的基本特性。
30.4.5 动作和感知的感觉处理是不同的
越来越多的研究支持这样一种观点,即用于控制动作的感觉信息是在神经通路中处理的,这些神经通路不
同于有助于感知的传入通路。有人提出视觉信息在大脑中以双流方式流动(第 25 章)。投射到后顶叶皮层的
侧流主要涉及将视觉用于动作(第 34 章),而投射到下颞皮层的腹侧流则涉及有意识的视觉感知。
这种将视觉用于动作和感知之间的区别是基于在患者研究中看到的分离现象。例如,患者 D.F. 腹侧流受
损后出现视觉失认症。例如,她无法通过口头或手来指示插槽的方向。然而,当被要求执行一个简单的动作时,
例如将卡片插入插槽时,她可以毫不费力且正确地调整手的方向以将卡片插入插槽(第 59 章)。相反,背侧
受损的患者可能会出现视神经共济失调,其中感知完好但控制受到影响。
虽然知觉和动作之间的区别来自临床观察,但它也可以在正常人身上看到,如大小-重量错觉。当举起 2
大小不同但重量相同的物体时,人们表示较小的物体感觉较重。这种错觉 100 多年前首次被记录下来,既
大又持久。当一个人被告知物体具有相同的重量时,它不会减轻,也不会因反复提升而减弱。
当受试者开始举起重量相同的大小物体时,他们会为较大的物体产生更大的抓力和负载力,因为他们认为
较大的物体更重。如图 30.4.6 所示,在 2 个物体之间交替后,他们迅速学会根据真实物体重量精确地调整指尖
力。这表明感觉运动系统识别出 2 个重量相等。尽管如此,大小-重量错觉仍然存在,这表明这种错觉不仅是大
脑中高层认知中心的结果,感觉运动系统也可以独立于这些中心运作。
A 实验装置
B
握力
(牛)
大目标
提起
小目标
提起
两个目标
负载力
(牛)
试验 1
试验 8
抓握
传感器
5
3
500 毫秒
30.4.6: 大小-量错觉A. 在每次试验中,受试者交替举起一个大物体和一个重量相同的小物体。受试者认
为较小的物体感觉比实际重。B. 在第一个试验中,受试者对较大的物体(橙色线)产生更大的抓握力和负载力,
因为预计它比小物体重。在第 8 次试验中,2 个物体的抓握力和负载力相同,这表明尽管持续有意识地感知重量
差异,但用于此动作的感觉运动系统会产生适合 2 个物体重量的抓握力和负载力
[250]
640
30.5 运动规划将任务转化为有目的的移动
30.5 运动规划将任务转化为有目的的移动
将现实世界的任务表达为目标:我想拿起杯子、跳舞或吃午饭。然而,动作需要详细说明驱动人体 600 多块
肌肉运动的时间序列。目标陈述与为实现该目标而募集特定肌肉的运动规划之间显然存在差距。
30.5.1 许多动作都采用了模式化的方式
运动系统以多种不同方式完成同一任务的能力称为冗余。如果完成任务的一种方法不切实际,通常会有替
代方法。例如,伸手拿某个物体这一最简单的任务,可以用无数种方法来完成。
运动的持续时间可以从很宽的范围内自由选择,并且在给定持续时间的特定选择的情况下,手沿着路径的
路径和速度曲线(即轨迹)可以呈现许多不同的模式。即使选择一条轨迹仍然允许无限多的关节配置将手握在
路径的任何给定点上。最后,将手臂保持在固定姿势可以通过广泛的肌肉协同收缩水平来实现。因此,对于任何
机芯,都必须从众多备选方案中做出选择。
我们都选择以自己的方式前进吗?答案显然是否定的。个体重复相同的行为以及个体之间的比较表明,运
动模式非常模式化。
模式化运动模式的不变性告诉我们一些关于大脑在规划和控制我们的动作时使用的原则。例如,在伸手时,
我们的手倾向于大致沿着一条直线路径移动,并且随着时间的推移,手速通常是平滑的、单峰的并且大致对称
(如图 30.5.1 所示的钟形)。做直线运动的倾向是一大类运动的特征,考虑到肌肉会旋转关节,这令人惊讶。
要实现手的这种直线运动需要复杂的关节旋转。串联关节(肩、肘、腕)的运动非常复杂,并且随着初始位
置和最终位置的不同变化很大。由于单个关节的旋转会在手部产生弧形,因此肘关节和肩关节必须同时旋转才
能产生直线路径。在某些方向上,肘部比肩部移动得更多;在其他情况下,情况恰恰相反。当手从身体的一侧移
动到另一侧时(如图 30.5.1所示, T2 移动到 T51 个或 2 个关节可能必须在中途反转方向。手轨迹比关节轨
迹更不变的事实表明,运动系统更关心控制手,即使以产生复杂的关节旋转模式为代价。
这种以任务为中心的运动规划可以说明我们以不同方式执行特定动作(例如写作)的能力,但结果大致相
同。如图 30.5.2 所示,无论字母的大小或用于产生它的肢体或身体部分如何,手写体在结构上都是相似的。这
种称为运动等效性的现象表明,有目的的运动在大脑中是抽象表示的,而不是一组特定的关节运动或肌肉收缩。
这种能够驱动不同效应器的运动的抽象表示提供了一定程度的动作灵活性,这对于预设的运动程序来说是不切
实际的。
30.5.2 运动规划可以是降低成本的最佳选择
为什么人类会从无数种可能性中选择一种特定的方式来执行任务?广泛的研究试图回答这个问题,已经出
现的基本思想是,规划可以等同于选择完成任务的最佳方式。在数学上,这等同于优化(即最小化)与运动相关
成本的过程。成本是一种用单个数字量化运动好坏(例如,能量、准确性、稳定性)的方法。
完成任务的不同方式会导致不同的成本。这允许对所有可能的解决方案进行排序,从而确定成本最低的解
决方案。运动的不变性将反映我们关心的那种运动的特定成本。已经提出了许多成本,但目前,大多数成功的理
论认为运动成本有 2 个主要组成部分:任务成功和努力。努力部分意味着我们希望以最少的精力成本取得成功。
要了解任务成功如何成为成本的组成部分,了解导致失败的原因是很有用的。不准确的内部模型或处理显
然限制了我们完成任务的能力,而运动学习旨在保持这些过程的准确性。然而,运动系统中的低层组件(例如
运动噪音)限制了成功。运动往往是可变的,并且可变性往往随着运动的速度或力量而增加。这种增加的部分
原因是运动神经元的兴奋性和增加力量所需的额外运动单位的随机变化。力的增量增加是由逐渐变小的运动神
经元组产生的,每个运动神经元产生不成比例的更大的力增量(第 31 章)因此,随着力量的增加,运动神经元
数量的波动会导致力量的更大波动。
通过要求受试者产生恒定的力,可以通过实验观察到这种情况的后果。这种力量产生的可变性随着力量水
平的增加而增加。在大范围内,这种变异性的增加由恒定的变异系数(标准偏差除以平均力)捕获。随着运动
速度的增加(因为更快的速度需要更大的肌肉力量),这种对力的可变性的依赖性也增加了指向运动的可变性。
641
30.5 运动规划将任务转化为有目的的移动
30.5.1: 手的路径和速度具有定型特征
[251]
A. 受试者坐在一个半圆形板前,抓住一个在水平面上移动并记录
手部位置的双关节装置的手柄。指示受试者在各种目标T1T6之间移动手。B. 一个对象在目标之间移动他的
手时所追踪的路径。C. 面板 B 中显示的 3 个手部路径cd e的运动学数据。所有路径大致都是直的,并且
所有手部速度曲线具有相同的形状和比例,与覆盖的距离成比例。相比之下,3 个手部路径的肘部和肩部角速度
分布不同。笔直的手部路径和速度的通用配置文件表明,规划是参考手部完成的,因为这些参数可以线性缩放。
参考关节进行规划需要计算关节角度的非线性组合。
642
30.5 运动规划将任务转化为有目的的移动
A
右手
C 左手
D
牙齿
E
B
右手
(腕关节固定)
30.5.2: 运动等效。不同运动系统实现相同行为的能力称为运动等效性。例如,可以使用身体的不同部位进行
书写。此处的示例由同一个人使用右手(惯用手)A、手腕固定的右手(B、左手(C、咬在牙齿之间的笔
D)和附在脚上的笔(E
如图 30.5.3 所示,移动精度随着速度的增加而降低被称为速度-精度权衡。这种关系不是固定的,部分技能学习,
例如学习弹钢琴,涉及能够在不牺牲准确性的情况下提高速度。
一般来说,努力和准确是矛盾的。准确性需要能量,因为校正需要肌肉活动,因此需要付出一定的代价。
确性和能量之间的权衡因不同的动作而异。走路时,我们可以选择小心翼翼地迈步,以确保我们不会绊倒,但这
需要消耗大量的能量。因此,我们愿意让自己冒偶尔绊倒的风险来节省能源。相比之下,在用刀叉进食时,我们
会优先考虑准确性而不是能量,以确保叉子不会碰到我们的脸颊。
因此,最佳运动是在节能的同时最大限度地减少噪音的不良后果。一种方法是指定一个理想的运动轨迹或
可以被认为是最佳的状态序列。虽然噪音和环境干扰会导致运动系统偏离预期的行为,但反馈的作用只是将运
动恢复到预期的轨迹。然而,这种方法在计算上不一定有效。我们可以指定最佳反馈控制器来生成运动,而不是
指定所需的身体状态。
30.5.3 最佳反馈控制以任务依赖的方式纠正误差
最佳反馈控制旨在最小化成本,例如能量和任务不准确的组合(第 34 章)。这种类型的反馈控制基于这样
一种想法,即人们不会在给定特定成本的情况下规划轨迹。相反,该成本用于创建一个反馈控制器,该控制器指
定例如位置误差(以及速度和力等其他误差)的反馈增益如何随时间变化。因此,给定任务目标,控制器指定适
合身体不同可能状态的运动命令。如图 30.5.4 所示,然后轨迹只是将反馈控制定律应用于身体状态的当前估计
的结果。反馈控制器是最优的,因为它即使在存在潜在干扰的情况下也可以最小化成本。
因此,最优反馈控制不会在前馈和反馈控制之间做出硬性区分。相反,在一项任务期间,前馈和反馈控制之
间的平衡沿着连续统一体变化,这取决于当前身体状态的估计受预测(前馈)或感官输入(反馈)影响的程度。
最佳反馈控制的一个重要特征是它只会纠正与任务相关的偏差,并允许与任务无关的偏差发生变化。例如,
当伸手去打开一个带有长水平手柄的出口门时,沿着手柄接触的位置并不重要,因此水平方向的偏差可以忽略
不计。这种考虑自然会导致最小干预原则,即只有在偏差会影响任务成功的情况下,才应该干预正在进行的任
务。
干预通常会给系统增加噪音(并且需要付出更多的努力)因此不必要的干预会导致性能下降。最佳反馈控
制的目的不是消除所有可变性,而是允许它在不干扰任务的维度上累积,同时在与任务完成相关的维度上最小
化它。最小干预原则得到研究的支持,这些研究表明反馈并不总是使系统返回到未受干扰的轨迹,而是经常以
643
30.5 运动规划将任务转化为有目的的移动
728 Part V / Movement
Figure 30–10 Accuracy of movement varies in direct pro-
portion to its speed.Subjects held a stylus and had to hit a
straight line lying perpendicular to the direction in which they
moved the stylus. Subjects started from one of three different
initial positions and were required to complete the movement
within three different times (140, 170, or 200 ms). A trial was
successful if the subject completed the movement within
10% of the required time. Only successful trials were used
for analysis. Subjects were informed when a trial was not
successful. The variability in the motion of the subjects’ arm
movements is shown in the plot as the standard deviation of
the movement endpoint plotted against average speed (for
each of three movement starting points and three movement
times, giving nine data points). The variability in movement
increases in proportion to the speed and therefore to the
force producing the movement. (Adapted, with permission,
from Schmidt et al. 1979.)
10
运动终点标准偏差 (毫米)
200
200
170
140
运动时间(毫秒)
100 150
平均速度(厘米/秒
50
10
9
8
7
6
5
4
3
2
1
目标线
可能的开始点
movement trajectory or sequence of states that can be
considered optimal. Although noise and environmen-
tal disturbances can cause the motor system to devi-
ate from the desired behavior, the role of feedback is
simply to return the movement back to the desired
trajectory. However, this approach is not necessarily
computationally efficient. Rather than specifying the
desired state of the body, we can specify an optimal
feedback controller to generate the movement.
Optimal Feedback Control Corrects for Errors in a
Task-Dependent Manner
Optimal feedback control aims to minimize a cost
such as a combination of energy and task inaccuracy
(Chapter 34). This type of feedback control is based on
the idea that people do not plan a trajectory given a par-
ticular cost. Instead, the cost is used to create a feedback
controller that specifies, for example, how the feedback
gain for positional errors (and other errors such as veloc-
ity and force) changes over time. Therefore, given the
goal of the task, the controller specifies the motor com-
mand suitable for different possible states of the body.
The trajectory is then simply a consequence of applying
the feedback control law to the current estimate of the
state of the body (Figure 30–11). The feedback controller
is optimal in that it can minimize the cost even in the
presence of potential disturbances.
Optimal feedback control, therefore, does not make
a hard distinction between feedforward and feedback
control. Rather, during a task, the balance between
feedforward and feedback control varies along a con-
tinuum that depends on the extent to which the esti-
mate of current body state is influenced by predictions
(feedforward) or by sensory input (feedback).
An important feature of optimal feedback control
is that it will correct only for deviations that are task
relevant and allow variation in task-irrelevant devia-
tions. For example, when reaching to open an exit door
that has a long horizontal handle, it is of little impor-
tance where along the handle one makes contact, so
deviations in the horizontal direction can be ignored.
Such considerations lead naturally to the minimal
intervention principle that one should only intervene
in an ongoing task if deviations will affect task success.
Intervening will generally add noise into the
system (and require an increased effort), so interven-
ing unnecessarily will lead to a decrement in perfor-
mance. The aim of optimal feedback control is not to
eliminate all variability, but to allow it to accumulate
in dimensions that do not interfere with the task while
minimizing it in the dimensions relevant for the task
completion. The minimal intervention principle is
supported by studies that show that feedback does not
always return the system to the unperturbed trajectory
but often acts in a manner to reduce the effect of the
disturbance on the achievement of the task goal and to
ensure that corrections are task-dependent.
Optimal feedback control emphasizes the setting
of feedback gains, which can be partially instanti-
ated by reflexes that generate rapid motor responses.
Optimal feedback control proposes that these rapid
responses should be highly tuned to the task at hand.
Kandel-Ch30_0707-0736.indd 728 18/01/21 6:00 PM
30.5.3: 运动的准确性与其速度成正比。受试者拿着手写笔,必须击中一条垂直于他们移动手写笔方向的直线。
受试者从 3 个不同的初始位置之一开始,并被要求在 3 个不同的时间(140170 200 毫秒)内完成运动。如
果受试者在要求时间的 10% 内完成运动,则试验成功。只有成功的试验才用于分析。当试验不成功时,受试者
会被告知。受试者手臂运动的变化在图中显示为运动终点的标准偏差与平均速度的对比(对于 3 个运动起点和
3 个运动时间中的每一个,给出 9 个数据点)。运动的可变性与速度成正比,因此与产生运动的力成正比
[252]
644
30.5 运动规划将任务转化为有目的的移动
Chapter 30 / Principles of Sensorimotor Control 729
成本 =
不准确
+ 努力
运动命令
噪声
感觉反馈
传出副本
任务
相关
可变性
任务
不相关
可变性
噪声
位置
速度
任务 状态估计器
位置
速度
时间
反馈增益
最优反馈控制律
Figure 30–11 Optimal feedback control.In order to generate
a movement for a given task, such as touching a horizontal bar,
the sensorimotor system specifies a cost that is a combination
of accuracy (eg, distance of the finger to the bar) and effort. To
generate a movement that minimizes this cost, the sensorimo-
tor system sets up an optimal feedback control rule that speci-
fies the time-varying gains. These gains specify how the motor
command should depend on states such as positional error and
hand velocity. The form of this feedback control law assures
that the movement is the best it can be in the presence of
internal noise and external perturbations. The optimal behavior
tends to let variability (blue ellipsoid, showing the possible
final locations of the hand) accumulate in dimensions that do
not affect task success (task-irrelevant variability), such as along
the axis of the bar, while controlling variability that would lead
to the hand missing the bar (task-relevant variability). Three
paths for reaching from the same starting point are shown; cor-
rections are made only in the task-relevant dimension.
Although the short-latency (monosynaptic) stretch
reflex responds only to muscle stretch, the long-
latency response has long been known to respond to
task-dependent factors (Chapter 32). Optimal feedback
control is important because it combines trajectory
generation, noise, and motor cost and provides a clear
comparison for the results of experimental work.
Multiple Processes Contribute to
Motor Learning
Animals have a remarkable capacity for learning new
motor skills simply through everyday interaction with
their environment. Although evolution can hard wire
some innate behaviors, such as the ability of a foal
to stand or a spider to spin a web, motor learning is
required to adapt to new and varying environments.
New motor skills cannot be acquired by fixed neural
systems. Sensorimotor systems must constantly adapt
over a lifetime as body size and proportions change,
thereby maintaining an appropriate relationship between
motor commands and body mechanics. In addition,
learning is the only way to acquire motor skills that are
defined by social convention, such as writing or dancing.
Most forms of motor learning involve procedural
or implicit learning, so-called because subjects are gen-
erally unable to express what it is they have learned.
Implicit learning often takes place without consciously
thinking about it and can be retained for extended
periods of time without practice (Chapter 52). Typical
examples of procedural learning are learning to ride a
Kandel-Ch30_0707-0736.indd 729 18/01/21 6:00 PM
30.5.4: 最佳反馈控制。为了针对给定的任务(例如触摸水平杆)生成运动,感觉运动系统指定了一个成本,
成本是准确性(例如,手指到杆的距离)和努力的组合。为生成使此成本最小化的运动,感觉运动系统设置了指
定时变增益的最佳反馈控制规则。这些增益指定运动命令应如何取决于位置误差和手速度等状态。这种反馈控
制法则的形式确保运动在存在内部噪声和外部扰动的情况下达到最佳状态。最佳行为倾向于让可变性(蓝色椭
圆体,显示手可能的最终位置)在不影响任务成功的维度上累积(与任务无关的可变性),例如沿着条的轴,
时控制可能会发生的可变性导致手错过了酒吧(任务相关的可变性)。显示了从同一起点到达的 3 个路径;仅在
与任务相关的方面进行更正。
645
30.6 多个过程有助于运动学习
一种方式起作用以减少干扰对实现任务目标的影响并确保纠正是任务-依赖。
最佳反馈控制强调反馈增益的设置,这可以通过产生快速运动响应的反射来部分实例化。最佳反馈控制建
议这些快速响应应该高度调整到手头的任务。虽然短潜伏期(单突触)牵张反射仅对肌肉牵拉有反应,但人们
早就知道长潜伏期反应对任务相关因素有反应(第 32 章)。最佳反馈控制很重要,因为它结合了轨迹生成、
声和运动成本,并为实验工作的结果提供了清晰的比较。
30.6 多个过程有助于运动学习
动物具有非凡的能力,可以通过与环境的日常互动来学习新的运动技能。尽管进化可以固定一些先天行为,
例如小马驹的站立能力或蜘蛛织网的能力,但需要运动学习来适应新的和变化的环境。
新的运动技能无法通过固定的神经系统获得。感觉运动系统必须在一生中不断适应身体尺寸和比例的变化,
从而在运动命令和身体力学之间保持适当的关系。此外,学习是获得社会习俗定义的运动技能的唯一途径,例
如写作或跳舞。
大多数形式的运动学习都涉及程序性或内隐性学习,之所以这样称呼是因为受试者通常无法表达他们所学
的内容。内隐学习通常是在没有有意识地思考它的情况下发生的,并且可以在没有练习的情况下保留很长时间
(第 52 章)。程序学习的典型例子是学习骑自行车或弹钢琴。相比之下,陈述性或显性学习指的是可以用关于世
界的陈述来表达并且可用于内省的知识(第 52 章)。记住脑神经的名称或去当地医院的方向是显性学习的例子。
陈述性记忆往往很容易被遗忘,尽管反复接触可以导致长期保留。我们在最初学习一些运动任务时使用明确的
学习策略,例如驾驶汽车,但随着时间的推移和练习,该技能会变得自动。
运动学习可以或多或少立即发生或随着时间的推移发生。我们几乎是立刻就学会了拿起一个重量不明的物
体,经过几周的练习我们学会了骑自行车,但掌握钢琴却需要数年时间。这些不同的时间尺度可能反映了任务
的内在难度以及执行任务必须克服的进化限制。例如,钢琴演奏需要学习对单个手指的精确控制,而在正常运
动中,例如伸手和抓握,个性化的手指运动很少见。感觉运动学习可分为 2 个广泛但重叠的类别:适应感觉运动
系统特性的改变和学习新技能。我们依次关注每一个。
30.6.1 基于误差的学习涉及适应内部感觉运动模型
基于误差的学习是许多经过充分研究的感觉运动适应范式背后的驱动力。例如,可以通过佩戴棱镜眼镜(甚
至眼镜)来改变肢体的视觉位置和本体感受位置之间的关系。这会改变视觉输入,从而使一个人伸手去拿某个
物体的方向被误导。通过反复尝试,调整到达轨迹以解决视觉和本体感觉之间的差异,这一过程称为视觉运动
学习。同样,要控制计算机鼠标,我们必须了解鼠标移动与屏幕上光标之间的运动学关系。此外,肢体的特性会
随着生长和工具的使用而变化。大脑必须通过重组或调整运动命令来适应这些变化。
在基于误差的学习中,感觉运动系统感知每个动作的结果并将其与期望结果和预测结果进行比较。例如,
投篮时,期望的结果是球穿过篮筐。但是,一旦您放开球,您可能会预测球会偏向篮筐右侧。预测和实际结果之
间的差异,称为感官预测误差,可用于更新球如何响应您的动作的内部模型。实际结果与期望结果之间的差异称
为目标误差,可用于调整您的规划(即目标方向)以减少误差。感官预测误差和目标误差对驾驶学习都很重要。
在将误差信号用于训练内部模型之前,可能必须对其应用额外的转换。例如,当我们投掷飞镖时,视觉坐标
会收到误差。这种感觉误差必须转换为适合于更新控制过程(例如反向模)的运动命令误差。当运动系统学
习新的感觉运动特性时,基于误差的学习往往会导致通过试验减少误差。
受试者可能会以 2 种方式中的任何一种来适应这种情况。受试者可以共同收缩他们手臂的肌肉,从而使手
臂变硬并减少扰动的影响,或者他们可以学习一个内部模型来补偿预期的力。通过检查后遗症(机器人关闭后
的动作)我们可以区分这 2 种学习形式。如果手臂只是变硬,它应该继续沿直线移动。如果学习了新的内部模
型,新模型应该补偿不再存在的力,从而产生与早期扰动相反方向的路径。在学习的早期,协同收缩用于在学习
内部模型之前减少误差,但是随着内部模型能够补偿扰动,协同收缩随后会降低。因此,如图 30.6.1D 所示,
在学习后关闭力时,受试者通常会在相反方向显示出较大的后效应,表明他们已经补偿了扰动。
646
30.6 多个过程有助于运动学习
Chapter 30 / Principles of Sensorimotor Control 731
C 扰动力
2
适应
3 事后影响
B 空场A 实验装置
D
1 初次接触
Y
X
手速度
(x)
手速 (y)
–1
–1
0
0
1
1
15
Figure 30–12 Learning improves the accuracy of reaching
in a novel dynamic environment.(Adapted, with permission,
from Brashers-Krug, Shadmehr, and Bizzi 1996. Copyright ©
1996 Springer Nature.)
A.A subject holds a robotic apparatus that measures the position
and velocity of the hand and applies forces to the hand.
B.When the motors are off (null field), the subject makes
approximately straight movements from the center of the
workspace to targets arrayed in a circle.
C.A clockwise force is then applied to the hand, shown as a
function of hand velocity. This field produces a force propor-
tional to the speed of the hand that always acts at right angles
to the current direction of motion.
D.Initially, the hand paths are severely perturbed in response to
the perturbing force (1). After some time, the subject adapts and
can again follow a straight path during the entire movement (2).
When the motors are then turned off, movement is again per-
turbed, but in a direction opposite to the earlier perturbation (3).
types and effectors, from the eye to whole-body move-
ments. For example, our normal symmetric pattern of
gait seems to rely on error-based learning. When the gait
pattern of subjects is perturbed by walking on a split-belt
treadmill in which one belt moves faster than the other,
they initially limp. However, step by step the gait pat-
tern naturally regains its symmetry (Figure 30–13), thus
showing that error-based learning can drive complex
whole-body coordinated movements. There is extensive
evidence that fast trial-by-trial error-based learning relies
on the cerebellum (Chapter 37).
Motor adaptation may not be a single unitary
process. Recent evidence suggests that adaptation
is driven by interacting processes whose outputs are
combined. These interacting processes could have dif-
ferent temporal properties: one process quickly adapt-
ing to perturbations but also rapidly forgetting what
was learned and the other learning more slowly but
retaining learning for a longer period (Figure 30–13B).
The advantage of such a mechanism is that the learning
processes can be matched to the temporal properties
of the perturbations, which can range from short-lived
(fatigue) to long-lasting (growth).
Although motor learning often takes much prac-
tice, once a task is no longer performed, deadapta-
tion is typically faster. However, the sensory inputs
associated with the particular action can be enough to
switch behavior. When subjects wear prismatic glasses
Kandel-Ch30_0707-0736.indd 731 18/01/21 6:00 PM
30.6.1: 学习提高了在新的动态环境中到达的准确性
[253]
A. 受试者拿着一个机器人装置,该装置测量手的位
置和速度并向手施加力。B. 当运动关闭时(空场)受试者从工作区中心大致直线移动到排列成圆圈的目标。C.
然后向手施加顺时针方向的力,显示为手速度的函数。该场产生与手的速度成正比的力,该力始终与当前运动
方向成直角。D. 最初,手的路径受到扰动力1的响应而受到严重扰动。一段时间后,受试者适应并可以在整
个运动过程中再次沿着直线路径移动(2。当运动随后关闭时,运动再次受到扰动,但方向与先前的扰动相反
3
647
30.6 多个过程有助于运动学习
这种基于误差的过程似乎是许多不同运动类型和效应器(从眼睛到全身运动)适应的基础。例如,我们正常
的对称步态模式似乎依赖于基于误差的学习。当受试者的步态模式受到干扰(在一条皮带比另一条跑得更快的
分体式跑步机上行走)时,他们最初会跛行。然而,如图 30.6.2 所示,逐步步态模式自然地恢复其对称性,这表明
基于误差的学习可以驱动复杂的全身协调运动。有大量证据表明,基于试错的快速学习依赖于小脑(第 37 章)
732 Part V / Movement
Figure 30–13 Learning new coordination patterns in
walking.
A.A subject walks on a split-belt treadmill. When the two belts
move at the same speed, subjects have a symmetric gait pat-
tern with equal step lengths.
B.In an adaptation study, the speeds of the belts are initially
the same, then become split so that the right belt moves faster
than the left, and then finally return to the same speed (top).
Step length symmetry is initially lost when the belts move at
different speeds, causing the subject to limp. Over time, the
symmetry is restored and the limping is abolished. When the
belts are once again moving at the same speed, an aftereffect
is seen (middle).
Maurice Smith and colleagues have shown that this type
of adaptation is composed of multiple underlying processes
that adapt on different timescales (bottom). The change in the
step length symmetry is composed of two processes: a fast
process (light green line) that adapts quickly but also rapidly
forgets what has been learned, and a slow process (dark green
line) that learns more slowly but has better retention. These
processes both adapt to learn from the error, and the sum of
these processes is the final adaptation (blue line). This dual-
rate learning system gives rise to the typical double exponential
learning curves seen in many forms of adaptation in which
adaptation is initially fast but tends to slow down as learning
proceeds. (Adapted, with permission, from Roemmich, Long,
and Bastian 2016.)
0
0
AB
步长不对称
对称性
变化
基准 适应 去适应
皮带速度 快速皮带
快速皮带
步长
慢速皮层
慢速皮带
200
that shift visual space, for example, they initially miss
when reaching to targets but soon learn to reach cor-
rectly. After repeated trials, the mere feel of the glasses,
without the prisms in place, is sufficient to evoke the
adaptive behavior appropriate for the prisms.
In general, we can quantify performance with
two measurements, accuracy and precision. Accuracy
is a measure of systematic errors or biases, for exam-
ple, on average how far a series of thrown darts are
away from the target. In contrast, precision is a meas-
ure of random errors, or statistical variability, in our
actions. Both accuracy and precision contribute to
performance. In general, accuracy can be improved
by adapting or calibrating motor commands so as to
reduce systematic errors. Although there is always
some variability in movement arising from irreducible
sensory and motor noise, the variability, as we have
seen, can be reduced through planning so as to have
minimal impact on task success. Most motor learning
tends to become automatic (ie, implicit) with time, but
early learning of some tasks can be aided by explicit
learning (ie, strategy), such as a verbal instruction on
how best to approach the task.
Not all sensory modalities are equally important
in learning all motor tasks. In learning dynamic tasks,
proprioception and tactile input are more important
than vision. We normally learn dynamic tasks equally
well with or without vision. However, individuals
who have lost proprioception and tactile input have
particular difficulty controlling the dynamic proper-
ties of their limbs or learning new dynamic tasks with-
out vision (Box 30–3).
Skill Learning Relies on Multiple Processes
for Success
In contrast to error-based learning in which the sensori-
motor system adapts to a perturbation to return to pre-
perturbation performance, learning skills such as tying
one’s shoelaces, juggling, typing, or playing the piano
instead involves improving performance in the absence
of a perturbation. Such learning tends to improve the
speed–accuracy trade-off. Initially, we may be able to hit
the correct keys on a keyboard when paced 1 second apart,
but with practice, the same accuracy can be achieved at
an increasingly quickening pace.
Kandel-Ch30_0707-0736.indd 732 18/01/21 6:00 PM
30.6.2: 在行走中学习新的协调模式。A. 受试者在分体式跑步机上行走。当两条皮带以相同的速度移动时,
试者具有步长相等的对称步态模式。B. 在一项适应性研究中,皮带的速度最初是相同的,然后分开,使得右边
的皮带移动得比左边的快,最后回到相同的速度(顶部)当皮带以不同的速度移动时,步长对称性最初会丢失,
导致受试者跛行。随着时间的推移,对称性恢复并且跛行被废除。当传送带再次以相同的速度移动时,可以看
到后遗症(中)莫里斯 · 史密斯及其同事表明,这种类型的适应由多个适应不同时间尺度的基础过程组成(底
部)步长对称性的变化由 2 个过程组成:一个快速过程(浅绿色线)适应速度快,但也很快忘记所学内容,
个缓慢过程(深绿色线)学习速度较慢但记忆力较好。这些过程都适应从误差中学习,这些过程的总和就是最
终的适应(蓝线)。这种双速率学习系统产生了在许多适应形式中看到的典型双指数学习曲线,其中适应最初很
快但随着学习的进行而趋于减慢
[254]
运动适应可能不是一个单一的过程。最近的证据表明,适应是由相互作用的过程驱动的,这些过程的输出是
相结合的。这些相互作用的过程可能具有不同的时间特性:如图 30.6.2B 所示,一个过程可以快速适应扰动,
也可以快速忘记所学内容,另一个过程学习速度较慢,但保留学习时间较长。这种机制的优点是学习过程可以
与扰动的时间特性相匹配,扰动的范围可以从短暂的(疲劳)到持久的(增长)
尽管运动学习通常需要大量练习,但一旦不再执行某项任务,死适应通常会更快。然而,与特定动作相关的
感官输入足以改变行为。例如,当受试者戴上可以改变视觉空间的棱镜眼镜时,他们最初在到达目标时会错过,
但很快就会学会正确到达。经过反复试验,在没有棱镜的情况下,仅凭眼镜的感觉就足以唤起适合棱镜的适应
性行为。
一般来说,我们可以通过准确度和精确度这 2 个测量来量化性能。准确性是衡量系统误差或偏差的指标,
如,一系列投掷的飞镖平均离目标有多远。相比之下,精确度是衡量我们行为中的随机误差或统计变异性的指
标。准确度和精确度都有助于提高性能。通常,可以通过调整或校准运动命令来提高精度,从而减少系统误差。
尽管不可减少的感觉和运动噪音总是会导致运动的一些可变性,但正如我们所见,可以通过规划减少可变性,
而将对任务成功的影响降到最低。随着时间的推移,大多数运动学习趋向于自动(即隐性),但一些任务的早期
学习可以通过显性学习(即策略)来辅助,例如关于如何最好地完成任务的口头指示。
并非所有感觉方式在学习所有运动任务时都同样重要。在学习动态任务中,本体感觉和触觉输入比视觉更
重要。无论有无视觉,我们通常都能很好地学习动态任务。然而,失去本体感觉和触觉输入的人特别难以控制四
肢的动态特性或在没有视觉的情况下学习新的动态任务(文本框 30.3
648
30.6 多个过程有助于运动学习
文本框 30.3 (本体感觉和触觉对感觉运动控制至关重要)
虽然视觉障碍对感觉运动控制的影响肯定是有限的,但盲人能够正常行走,轻松地接触和抓住已
物体。这与本体感觉和触觉的罕见丧失形成了鲜明对比。
一些感觉神经病选择性地损伤外周神经和背根中携带大部分本体感觉信息的大直径感觉纤维。一
多世纪以来,本体感觉丧失导致的运动控制障碍一直困扰着神经学家和生理学家。对感觉神经病患者
研究为了解感觉和运动规划之间的相互作用提供了宝贵的见解。
正如预期的那样,这类患者失去了关节位置感、振动感和精细触觉辨别(以及肌腱反射),但疼痛感
和温度感都得到了充分保留。患有周围神经病变的患者无法保持稳定的姿势,例如,拿着杯子或闭着眼睛
站着。动作也变得笨拙、不协调和不准确。
随着患者学会用视觉代替本体感觉,功能可能会在几个月内恢复,但这种补偿仍然让患者在黑暗
完全丧失能力。其中一些困难反映了无法检测在看不见的运动中产生的误差,比如物体的重量与预期
同。
当患者试图做出快速方向反转的运动时,周围神经病变尤其会使人丧失能力。如图 30.6.3 所示,对这
些运动过程中的关节力矩的分析表明,具有完整本体感觉的受试者预测节段间力矩,而没有本体感觉
人则没有这样做。
然而,同样的患者很容易适应剧烈的运动变化,比如在镜子里看手的时候画一幅画。事实上,他们的
表现比正常受试者要好,也许是因为他们学会了用视觉引导自己的动作,而且因为他们缺乏本体感觉,
以在视觉和本体感觉之间没有任何冲突。
即使在正常受试者中,触觉输入在操作任务中的相对重要性也可以很容易地证明。闭着眼睛点火
相对容易。然而,如果指尖被局部麻醉剂弄得麻木,那么即使在全视力下,这项任务也非常困难,因为火
柴往往会从手指上滑落。
Chapter 30 / Principles of Sensorimotor Control 733
While visual impairment certainly has limiting effects
on sensorimotor control, blind people are able to walk
normally and reach and grasp known objects with ease.
This is in stark contrast to the rare loss of proprioceptive
and tactile sense.
Some sensory neuropathies selectively damage the
large-diameter sensory fibers in peripheral nerves and
dorsal roots that carry most proprioceptive informa-
tion. Impairments in motor control resulting from loss of
proprioception have fascinated neurologists and physi-
ologists for well over a century. Studies of patients with
sensory neuropathies provide invaluable insight into the
interactions between sensation and movement planning.
As expected, such patients lose joint position sense,
vibration sense, and fine tactile discrimination (as well
as tendon reflexes), but both pain and temperature
senses are fully preserved. Patients with peripheral neu-
ropathies are unable to maintain a steady posture, for
example, while holding a cup or standing, with the eyes
closed. Movements also become clumsy, uncoordinated,
and inaccurate.
Some recovery of function may occur over many
months as the patient learns to use vision as a substitute
for proprioception, but this compensation still leaves
patients completely incapacitated in the dark. Some of
this difficulty reflects an inability to detect errors that
develop during unseen movements, as occurs if the
weight of an object differs from expectation.
Peripheral neuropathies are particularly incapaci-
tating when patients try to make movements with rapid
direction reversals. Analyses of the joint torques during
these movements show that subjects with intact pro-
prioception anticipate intersegmental torques, whereas
those without proprioception fail to do so (Figure 30–14).
However, the same patients easily adapt to dras-
tic kinematic changes, such as tracing a drawing while
viewing their hand in a mirror. In fact, they perform
better than normal subjects, perhaps because they have
learned to guide their movements visually and, because
they lack proprioception, do not experience any conflict
between vision and proprioception.
Even in normal subjects, the relative importance of
tactile input in manipulation tasks can be easily demon-
strated. It is relatively easy to light a match with one’s
eyes closed. However, if the tips of the digits are made
numb with local anesthetic, then even under full vision
the task is remarkably hard because the match tends to
slip from the fingers.
Box 30–3 Proprioception and Tactile Sense Are Critical for Sensorimotor Control
5
厘米
125°
60°
20°
控制
本体感觉丧失的受试者
肘部
肩部
伸展
弯曲
Figure 30–14 Patients lacking proprioception cannot
make an accurate movement that requires a rapid
reversal in path. (Left) The subject tries to trace a template
(gray line) while her hand is hidden from view. The joint
angles for the elbow and shoulder of a normal subject show
good alignment (Right top), leading to an accurate reversal
(Left top). In contrast, the timing of the joint reversal is poor
in subjects who lack proprioceptive input (Right bottom), lead-
ing to large errors in the path (Left bottom). These patients
cannot anticipate and correct for the intersegmental dynam-
ics that occur around the path reversal. (Adapted, with per-
mission, from Sainburg et al. 1995.)
Kandel-Ch30_0707-0736.indd 733 18/01/21 6:00 PM
30.6.3: 缺乏本体感觉的患者无法做出准确的运动,需要快速逆转路径。(左)受试者试图追踪一个模板(灰
色线),而她的手被隐藏在视线之外。正常受试者的肘部和肩部的关节角度显示出良好的对齐(右上),从而
致准确的反转(左上)。相反,在缺乏本体感觉输入的受试者中,关节翻转的时机很差(右下),导致路径上
大误差(左下)。这些患者无法预测和纠正路径逆转周围发生的节段间动态。
30.6.2 技能学习的成功依赖于多个过程
与感觉运动系统适应扰动以恢复扰动前表现的基于误差的学习相反,系鞋带、杂耍、打字或弹钢琴等学习
技能涉及在没有扰动的情况下提高表现。这种学习往往会提高速度-准确性的权衡。最初,我们可能能够以 1
649
30.7 要点
的间隔敲击键盘上的正确键,但通过练习,可以以越来越快的速度达到相同的准确性。
对于某些技能,所执行的操作与任务的成功或失败之间可能存在复杂的关系。例如,当孩子们第一次坐在
秋千上时,他们必须学习使秋千变高所需的复杂的腿部和身体动作序列。与基于误差的学习相比,没有现成的
误差信号可用于调整当前动作,因为摆动的高度不是由当前动作直接决定的,而是由身体和腿部运动的长期历
史决定的。在这种复杂场景中的学习可以使用强化学习来实现,在强化学习中,感觉运动系统调整其命令以努
力最大化奖励,即任务成功。在最一般的形式中,强化学习试图最大化的性能指标是所有未来奖励的总和。然
而,由于我们倾向于支持即时奖励而不是延时奖励,因此通常会对总和进行加权以通过逐步贴现未来奖励来反
映这一点。
强化学习比基于误差的学习更普遍,因为训练信号是成功或失败,而不是每个时间点的误差。强化学习的
另一个显著特性是,学习系统的成功或失败可能以非平凡的方式取决于所采取动作的历史。对于需要采取一系
列复杂动作才能实现目标的任务,例如系鞋带,并且及时从动作中移除结果或奖励,不能轻易应用基于误差的
学习。强化解决的一个关键问题是信用分配问题:当我们最终成功或失败时,我们应该相信或指责序列中的哪
个动作?这正是强化学习算法擅长解决的问题。
强化学习主要分为两类,一类依赖于内部模型,另一类不依赖于内部模型。基于模型的强化构建任务模型
(例如,迷宫的结构)使用这样的模型,学习者可以以目标为导向的方式有效地进行规划。相反,在无模型强化
学习中,学习者只是将动作与成功或失败联系起来;那些导致成功的人更有可能再次表演。这种学习会导致运
动习惯。虽然无模型学习避免了构建模型的计算负担,但它也不太能够泛化到新情况。这 2 种强化学习甚至
以一起作用,不同的任务可以不同程度地依赖它们。基底神经节中的多巴胺能系统与人们在强化学习中预期的
信号有关,例如预期奖励。此外,这些系统的功能障碍与运动障碍、成瘾和其他可能与强化信号相关的问题有关
(第 38 章)
最后,有效策略的发展在运动技能习得中起着关键作用。现实世界任务的技能学习通常涉及不同时空尺度
的一系列决策过程。例如,网球运动员的技术不仅取决于她击球的精确度,还取决于她对瞄准目标做出正确决
定的速度,以及她如何很好地利用自己的感官来提取与任务相关的信息。
30.6.3 感觉运动表征约束了学习
在一次运动中获得的信息通常太稀疏或太嘈杂,无法明确确定误差来源。例如,如果网球运动员在发球时
将球击入网中,问题可能是球抛得不够高、击球过早、球拍线松了、有一阵风、或者运动员疲劳了。如果球拍的
动力学发生了变化,球员最好在下一次击球时进行适应。如果问题由暂时的阵风引起,则无需调整。为了解决这
个问题,感觉运动学习系统限制了系统响应误差的更新方式。这些约束反映了关于任务结构和误差来源的内部
假设,并决定了系统如何表示任务。事实上,在较慢的时间尺度上,学习本身可以改变表征。
虽然运动系统的最终输出是其 600 多块肌肉的收缩,但大脑并不是独立控制每块肌肉的。在当前的感觉运
动控制模型中,运动命令由多个模块生成,这些模块可以根据任务的要求有选择地参与。模块化架构的示例包
括多个内部模型、运动原语和运动协同作用(第 36 章)
运动基元可以被认为是神经控制模块,可以灵活组合以生成大量行为。基元可能表示特定肌肉活动或一组
一起激活肌肉的时间分布,称为协同作用。整体运动输出将是所有基元的总和,并根据每个模块的激活水平进
行加权。然后,这些基元群体的构成决定了对学习施加哪些结构约束。例如,如果运动系统具有许多基元的行为
将很容易学习,而任何现有原语都无法近似的行为将无法学习。
30.7 要点
1. 大脑中发生的精细信息处理和存储的主要目的是使我们能够通过我们的运动系统与我们的环境互动。
2. 我们无限多样和有目的的运动行为受运动系统综合作用的支配,包括运动皮层、脊髓、小脑和基底神经
节。
3. 为了控制动作,中枢神经系统使用了一系列感受-运动转换,将传入的感觉信息转换为运动输出。
650
30.7 要点
4. 从快速反应到较慢的自主控制,不同级别的感觉运动反应的速度与复杂程度之间存在权衡。
5. 运动系统使用前馈回路或纠错反馈回路产生指令;大多数运动都涉及 2 种类型的控制。
6. 大脑使用感觉运动系统的内部模型来促进控制。
7. 使用感觉和运动信号以及前向预测模式来估计身体状态,以减少反馈延迟的不利影响。
8. 感觉输入和运动输出的可变性以及感受-运动转换的不准确性是运动误差和可变性的基础,导致速度和准
确性之间的权衡。
9. 运动规划可以使用运动系统的冗余来移动,从而减少运动噪音的负面影响,同时减少工作量。
10. 运动控制回路不是静态的,而是在整个生命周期中不断修改和重新校准。
11. 运动学习改善新情况下的运动控制,不同形式的感官信息对学习至关重要。基于误差的学习对于适应简
单的感觉运动扰动尤为重要。强化学习对于更复杂的技能学习尤为重要,它可以依赖模型(基于模型)或直接
简单地强化运动动作(无模型)
12. 大脑使用的运动表征限制了感觉运动系统在学习过程中更新的方式。
13. 感觉运动控制的研究侧重于深入了解相对简单的任务,例如伸手和走路。尽管这些任务可以进行分析和
建模,但它们并没有捕捉到真实世界运动控制的全部复杂性。挑战在于确定这些原则是否可以推广到系鞋带和
学习滑板等任务。
651